import org.apache.spark.sql.SparkSession

object ah {

  def main(args: Array[String]): Unit = {
    // 创建 SparkSession
    val spark = SparkSession.builder()
      .appName("Test")
      .master("local[*]")
      .getOrCreate()
    val sc = spark.sparkContext

    try {

      val rdd1 = sc.parallelize(List(('a',1),('b',2),('c',3)))
      val rdd2 = sc.parallelize(List(('a',1),('d',4),('e',5)))
      val j_rdd = rdd1.join(rdd2)
      j_rdd.collect
      j_rdd.collect().foreach(println)
    } finally {
      // 停止 SparkSession
      spark.stop()
    }
  }
}
